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科技 资源 描述 模型 和 建立 方法 研究 
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摘要 : [目的 /意义 ] 科技 创新 是 我 国 发 展 的 关键 途径 ， 需 要 科技 资源 的 共享 和 协同 创新 。 科 技 资 
源 共 享 是 一 个 系统 工程 ， 需 要 建立 科技 资源 的 描述 模型 ， 在 此 基础 上 进行 科技 资源 集成 、 评 价 和 分 享 。 
[ 方法 /过程 ] 提出 科技 资源 描述 模型 的 结构 框架 ， 包 括 : 科技 资源 分 类 模型 、 科 技 资源 元 数据 模型 、 科 
技 资源 本 体 模型 、 科 技 资源 知识 元 模型 、 科 技 资 源 图 谱 模型 等 。 其 中 ， 科 技 资源 包括 知识 、 数 据 、 产 品 、 
人 才 、 软 件 、 硬 件 等 资源 。 本 文 阅 述 了 科技 资源 描述 模型 的 特点 和 作用 ， 并 给 出 科技 资源 描述 模型 的 建 
立方 法 。[ 结果 / 结论 ] 本 文 的 主要 贡献 是 : @ 通 过 科技 资源 描述 模型 的 规范 化 ， 有 助 于 不 同类 型 的 科 
技 资源 的 集成 分 享 ; @ 通 过 科技 资源 的 不 同类 型 的 描述 模型 的 集成 研究 ， 形 成 科技 资源 描述 模型 的 体系 
架构 ， 为 进行 科技 资源 的 全 面 系统 描述 提供 整体 解决 方案 ， 有 助 于 解决 科技 资源 共享 难 的 问题 ; 回 提出 
科技 资源 描述 模型 的 建立 方法 ， 其 特点 是 利用 新 一 代 信息 技术 依靠 大 众 共 建 模型 ， 依 靠 科 技 资源 描述 过 
程 的 大 数据 智能 分 析 技 术 ， 建 立 和 优化 科技 资源 描述 模型 。 

关键 词 : 科技 资源 ; 科技 资源 描述 模型 ， 模 型 建立 方法 ; 科技 资源 共享 ; 知识 图 谱 
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"MEE 强 ， 科 技 创新 资源 分 散 、 重 复 、 低 效 的 问题 还 
没有 从 根本 上 得 到 解决 。 

规范 、 合 理 、 科 学 的 科技 资源 描述 方法 是 
解决 科技 资源 分 散 、 重 复 、 低 效 问题 的 有 效 方 
法 之 一 。 利 用 科技 资源 描述 方法 可 从 不 同 角度 


习近平 总 书记 在 中 国 科学 院 第 十 九 次 院士 
大 会 、 中 国 工程 院 第 十 四 次 院士 大 会 上 的 讲话 
中 指出 : 科技 体制 改革 还 存在 一 些 有 待 解决 的 
突出 问题 ， 主 要 是 国家 创新 体系 整体 效能 还 不 
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对 科技 资源 进行 规范 化 ， 有 效 支持 科技 资源 的 
集成 、 评 价 和 共享 。 科 技 资源 包括 知识 、 数 据 、 
产品 、 人 才 、 软 件 、 硬 件 等 不 同类 型 。 在 这 方 
面 已 经 有 不 少 的 研究 与 应 用 ， 但 还 存在 一 些 不 
足 和 进一步 的 需求 : 

(1 ) 现 有 的 研究 主要 集中 在 对 不 同类 型 的 
科技 资源 进行 各 自 的 描述 ， 但 缺乏 对 不 同类 型 
的 科技 资源 进行 统一 描述 ， 这 对 不 同类 型 的 科 
技 资源 的 统一 搜索 和 集成 不 利 。 例 如 ， 对 知识 
图 谱 的 研究 较 多 凹 ， 而 科技 资源 图 谱 包括 数据 、 
产品 、 人 才 、 软 件 、 硬 件 等 的 “图 谱 ”， 这 种 
研究 还 是 比较 缺乏 。 在 中 国 知 网 中 利用 “科技 
资源 图 谱 ” 作 为 主题 词 搜索 ， 搜 索 到 的 结果 为 0 
条 ， 而 利用 “知识 图 谱 ” 作 为 主题 词 搜索 ， 搜 
索 到 10 542 条 结果 。 

(2 ) 人 们 已 经 对 一 些 科技 资源 的 分 类 模型 、 
元 数据 模型 、 本 体 模型 、 知 识 元 模型 、 知 识 诺 
谱 等 进行 了 分 别 研 究 ， 并 且 已 经 有 一 些 国家 标 
准 。 王 志 强 、 杨 青海 等 认为 : 科技 资源 开放 共 
享 过 程 中 产生 了 数量 庞大 、 种 类 繁杂 的 标准 规 
范 ， 这 些 标准 规范 对 推动 科技 资源 建设 发 挥 了 
重要 作用 , 但 是 也 存在 着 一 些 问题 ， 如 缺乏 全 
局 性 顶层 设计 ， 没 有 形成 统一 的 标准 化 建设 体 
系 框架 中。 需要 进一步 对 这 些 模型 进行 集成 统 
一 研究 ， 并 用 于 科技 资源 的 描述 。 

(3 ) 在 现 有 的 研究 中 ， 对 知识 资源 的 描述 
已 经 有 比较 系统 的 方法 ， 需 要 将 这 些 方法 扩展 
到 其 它 类 型 的 科技 资源 。 

笔者 将 对 这 些 问 题 进行 研究 ， 这 有 助 于 科 
技 资源 的 描述 方法 的 规范 化 、 以 及 解决 科技 资 
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源 共享 难 的 问题 。 


候 科技 资源 描述 模型 的 结构 框架 
科技 资源 描述 是 科技 资源 的 一 种 “画像 ”， 
是 对 科技 资源 的 分 类 ， 是 对 科技 资源 的 有 序 化 ， 
能 够 帮助 用 户 快速 搜索 到 所 需要 的 科技 资源 和 了 
解 科技 资源 的 主要 内 容 ， 促 进 科技 资源 相互 之 间 
的 快速 集成 ， 解 决 数据 格式 不 一 致 和 同一 概念 描 
述 不 一 致 的 问题 。 图 1 为 科技 资源 描述 模型 的 结 
构 框架 ,图 2 为 科技 资源 描述 模型 间 的 关系 。 
科技 资源 描述 模型 中 的 各 子 模型 定义 如 
下 : 科技 资源 分 类 模型 一 描述 科技 资源 的 分 


类 信息 ， 以 便 找到 所 需要 的 科技 资源 ， 科技 资 
源 元 数据 模型 一 一 描述 科技 资源 的 主要 数据 格 


式 ， 以 便 科 技 资源 的 快速 集成 ;， 科技 资源 本 体 
模型 一 一 对 科技 资源 的 规范 性 摘 述 ,以 便 准 确 、 
全 面 地 找到 所 需要 的 科技 资源 ; 科技 资源 知识 
元 一 一 对 科技 资源 内 容 进行 简要 描述 ， 以 便 快 
速 了 解 科技 资源 的 主要 内 容 ; 科技 资源 图 谱 模 
型 一 一 简要 描述 科技 资源 概念 间 的 关系 ， 以 便 
科技 资源 的 搜索 和 推理 。 

在 科技 创新 和 其 他 科技 工作 中 ,往往 需要 
多 种 不 同类 型 的 科技 资源 的 集成 使 用 ， 如 某 研 
究 任 务 ， 需 要 能 胜任 的 研发 人 员 ( 从 人 才 资 源 
中 选择 ) 、 与 研发 任务 相关 的 产品 资源 ( 参考 
相似 产品 ， 提 高 研发 效率 ) 、 知 识 资 源 ( 如 产 
品 原理 ， 产 品 可 制造 性 、 可 装配 性 、 可 维护 性 
等 知识 ) 、 数 据 资 源 ( 如 相似 产品 的 历史 使 用 
数据 、 维 护 数据 等 ) 、 软 件 资源 ( 帮助 研发 的 
计算 机 辅助 软件 ) 、 硬 件 资源 ( 如 实验 设备 、 
测试 仪器 等 ) 。 


快速 精准 找到 需要 的 科技 资源 支持 科技 资源 的 快速 集成 ” 支持 科技 资源 的 有 效 共享 
4 4 4 
| | I | 
的 。” ”解决 科技 资源 解决 数据 格式 解决 同一 概念 描 突出 科技 资源 支持 科技 次 
的 分 类 问题 不 一 致 的 问题 述 不 一 致 的 问题 的 核心 内 容 源 的 有 序 化 
arau I -会 = = -会 
描述 模型 | 科技 资源 分 类 模型 || 科技 资源 元 数据 模型 || 科技 资源 本 体 模型 || 科技 资源 知识 元 || 科技 资源 知识 图 庶 
下 下 不 不 F 
科技 资源 知识 资源 数据 资源 人 才 资 源 产品 资源 软件 资源 硬件 资源 | e 


图 1 科技 资源 描述 模型 的 结构 框架 
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静音 白色 节能 空气 净化 变频 ERER …- | 


| E 科技 资源 分 类 模型 
小 家 电 ao 色 家 电 


D | 关键 词 结构 的 科技 资源 分 类 体系 


冰箱 “… 空调 


科技 资源 元 数据 模型 


名 称 | 品牌 | 能 效 | 生产 日 期 | 空调 | 工作 
$ 名 称 | 等 级 功率 | 方 


树 状 结构 的 科技 资源 分 类 体系 
同一 概念 多 种 描述 进行 关联 


式 
数据 | 字符 | 字符 | YYYY- | 数字 | 字符 
格式 串 串 MM-DD E3 


a| 科技 资源 本 体 模型 


标准 本 体 


aux/ 奥克斯 证 书 编号 : 2017010703967000; 
变频 分 体 热泵 型 挂 壁 式 房间 空气 调节 器 ，KFR- 
科技 资源 知识 元 » 35GW/BpTYC1+1; 1.5 匹 变频， 适用 面积 : 15 
= | SE m (A) -2m ( 含 ) ， 能 效 等 级 ， 一 级 
概念 描述 规范 化 四 
A m mE ei 
科技 资源 知识 图 详 | 只 = 


O 科技 资源 分 类 模型 及 建立 方法 
3.1 科技 资源 分 类 模型 的 定义 

科技 资源 分 类 模型 是 把 具有 某 种 属性 或 特 
征 的 科技 资源 信息 归并 起 来 ， 通 过 其 属性 或 特 
征 来 区 别 不 同类 别 的 科技 资源 信息 中。 根据 不 
同 的 科技 资源 及 需求 ， 科 技 资源 分 类 模型 可 以 
分 为 以 下 两 种 : 


图 2 科技 资源 描述 模型 间 的 关系 


树 状 结构 的 科技 资源 分 类 模型 又 被 称 为 科技 资 
源 分 类 编码 体系 中、 科技 资源 分 类 目录 、 科 技 
资源 标识 体系 等 。 与 科技 资源 分 类 相近 的 分 类 
编码 体系 有 制造 业 信息 化 服务 平台 服务 资源 分 
类 编码 中、 网 络 化 制造 环境 下 的 制造 资源 分 类 
编码 、 企 业 信息 分 类 编码 等。 具体 的 科技 
资源 的 分 类 编码 标准 已 经 有 工艺 分 类 编码 外 、 
零件 分 类 编码 等。 


(1 ) 树 状 结构 的 科技 资源 分 类 模型 。 这 是 
采用 数字 或 字母 的 形式 ， 按 照 分 类 编码 的 一 般 
原则 与 方法 , 对 科技 资源 进行 统一 分 类 和 编码 ， 
4 有 层次 性 和 系统 性 的 特点 ， 可 以 确定 任 一 科 
技 资源 在 科技 资源 体系 中 的 位 置 与 相互 关系 。 


树 状 结构 的 科技 资源 分 类 模型 首先 按照 科 


技 资源 的 性 质 不 同 进行 基本 分 类 。 表 1 介绍 了 
科技 资源 现 有 的 一 些 分 类 理论 ， 体 现 了 科技 资 


源 分 类 的 多 样 性 。 


表 1 科技 资源 现 


的 一 些 分 类 


包括 科技 人 力 资源 、 科 技 财力 资源 、 科 技 物力 资源 、 科 技 信 息 资源 ) 、 整 体 功能 性 


分 类 理论 科技 资源 要 素 的 主要 内 容 
二 要 素 论 “科技 信息 资源 、 科 技 实物 资源 am; 科技 基础 条 件 资源 、 技 术 创新 资源 等 中 
三 要 素 论 。 科技 实物 资源 、 科 技 信 息 资源 、 科 技 服务 资源 外 
四 要 素 论 。 ”科技 人 力 资源 、 财 力 资源 、 物 力 资源 以 及 数字 化 时 代 的 信息 资源 0 
BIC SRR. BOER. WIAR, ERARO 
五 要 素 论 “科技 人 力 资源 、 科 技 财力 资源 、 科 技 装备 资源 、 科 技 信息 资源 、 科 技 政策 与 管理 资源 
到 人 人力、 物力 、 财 力 、 组 织 、 管 理 、 信 息 等 资源 0 
上 要 素 论 “基础 性 核心 科技 资源 
AVC 科技 资源 (包括 科技 市 场 资源 、 科 技 制度 资源 和 科技 文化 资源 ) ng 
八 要 素 沦 。 ”大 型 科学 仪器 设备 、 重 大 科技 基础 设施 、 研 究 试 验 基地 、 自 然 科技 资源 、 科 学 数据 、 科 技 图 书 文献 、 科 技 


成 果 、 科 普 资源 等 7 
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国家 标准 《GB/T 32843-2016 科技 资源 标识 》 
给 出 了 科技 资源 标识 方法 ， 这 是 一 种 树 状 结构 
的 科技 资源 分 类 模型 ， 如 图 3 所 示 : 


om 口 口 口 口 口 : 口 口 : 口 口 … O 


中 国 科技 科技 资源 标识 “科技 资源 ”内 部 标识 符 
资源 代号 注册 机 构 代码 ”类 型 代码 (不 定 长 ) 


图 3 科技 资源 标识 符 结构 ( GB/T 32843-2016 科技 
资 资源 标识 ) 


其 中 : 中 国 科技 资源 代号 为 CSTR; 科技 资 
源 标识 注册 机 构 代 码 为 5 位 码 ; 科技 资源 类 型 
代码 为 2 位 码 ; 内 部 标识 符 不 定 长 ， 由 科技 资 
源 标 识 注册 机 构 分 配 ， 确 保 在 同一 科技 资源 标 
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识 注 册 机 构 注 册 的 每 个 科技 资源 的 内 部 标识 符 
的 唯一 性 。 

该 方法 的 缺点 是 : 对 于 同一 科技 资源 ( 如 
某 科技 文献 ) ， 不 同 科 技 资源 标识 注册 机 构 给 
出 的 科技 资源 标识 符 是 不 同 的 。 但 如 果 不 考虑 
科技 资源 标识 注册 机 构 ， 面 对 如 此 众多 的 科技 
资源 ， oe 

(2) 关键 词 结 构 的 科技 资源 分 类 模型 。 
人 
属性 或 特征 的 表征 和 描述 。 这 里 的 关键 词 或 者 
标签 往往 是 大 众 编制 ， 所 以 又 称 大 众 分 类 法 。 
这 类 分 类 体系 比较 适合 互联 网 中 的 资源 分 享 "。 
表 2 为 两 种 科技 资源 分 类 模型 的 比较 : 


表 2 两 种 科技 资源 分 类 模型 的 比较 


类 别 树 结构 的 科技 资源 分 类 模型 关键 词 结构 的 科技 资源 分 类 模型 
主观 性 的 A i ae BEN; 通过 大 数据 的 分 析 ， 减少 个 人 主观 性 的 影响 ， 反 
影响 很 强 ; 难以 表达 成 唯一 的 分 类 体系 AE ol = 
灵活 性 较 弱 ; 修改 难 很 强 ; 维护 难 
二 很 温 ， 树 状 结 格 ap Keb hy fly MEH 较 弱 ; ee ee 相互 关系 ， oo 
编制 的 复 ”编制 复杂 要 兼顾 各 种 科技 资源 分 类 的 需要 ， 包 括 知 编制 简单 
杂 性 识 、 数 据 、 人 才 、 产 品 、 软 件 、 硬 件 等 科技 资源 。 i 
一 致 性 较 强 ; 由 专家 讨论 统一 确定 较 弱 ; 人 们 可 能 采用 不 同 的 术语 描述 同一 概念 
持续 性 资源 描述 具有 和 较 长 的 持续 性 ， 可 以 有 效 保证 其 在 时 间 有 时 关键 词 的 描述 随时 间 有 较 大 变化 ， 使 过 去 的 资源 的 


历程 上 的 一 致 性 


3.2 科技 资源 分 类 模型 的 需求 

科技 资源 分 类 模型 的 需求 主要 包括 如 下 几 
个 方面 : 

(1) 有 助 于 科技 资源 的 统一 
和 共享 服务 ; 

(2 ) 通过 建立 科技 资源 的 分 级 标准 ， 支 持 
科技 资源 的 开放 和 共享 ; 

(3 ) 具有 规范 化 和 标准 化 的 特性 ， 支 持 科 
技 资源 的 供需 匹配 ; 

(4) 可 以 快速 定位 到 所 需要 的 科技 资源 ， 
支持 科技 资源 共享 。 
3.3 科技 资源 分 类 模型 的 建立 方法 

(1 ) 树 状 结构 的 科技 资源 分 类 模型 的 建立 
方法 。 本 文 主要 关注 企业 、 平 台 的 科技 资源 分 


一 有 效 组 织 管理 


搜索 变 得 困难 


类 模型 。 因 为 国际 、 国 家 的 科技 资源 分 类 模型 
比较 宽泛 , 难以 满足 具体 企业 .平台 的 具体 需求 。 

本 文 参考 《中 国 图 书馆 分 类 法 》《GB/T 
32843-2016 科技 资源 标识 》、 国 际 专 利 分 类 体 
A (IPC) 等 分 类 体系 ， 在 此 基础 上 进行 扩展 建 
立 企 业 或 行业 平台 的 科技 资源 分 类 模型 。《 中 
国 图 书馆 分 类 法 》( 简称 《中 图 法 》) 是 当今 
国内 图 书馆 使 用 最 广泛 的 分 类 法 体系 。 目 前 国 
际 上 主要 的 专利 分 类 体系 有 国际 专利 分 类 体系 
(IPC)、 日 本 专利 分 类 体系 (FUF-term)、 美 国 专 
利 分 类 体系 (USPC) 、 欧 洲 专利 分 类 体系 (ECLA/ 
ICO) 以 及 联合 专利 分 类 (CPC) 等 。 在 知识 资 
源 分 类 方面 可 以 参考 《GB/T 23703.7-2014 知识 
管理 第 7 部 分 : 知识 分 类 通用 要 求 》。 
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细 分 类 别 的 科技 资源 可 以 参考 一 些 现 有 标 
准 ，2020 年 1 月 29 日 在 国家 标准 信息 查询 平台 
( http://www.gov.cn/fuwu/bzxxcx/bzh.htm ) 输入 
“分 类 ”搜索 到 国家 标准 620 个 、 行 业 标 准 704 
个 、 地 方 标准 134 个 。 其 中 不 少 具有 参考 价值 。 

科技 资源 的 树 结 构 分 类 体系 由 本 领域 专家 
编制 ， 将 科技 资源 归 入 对 应 的 子 类 ， 检索 时 可 
按 树 状 结构 一 层 一 层 地 找到 所 需要 的 科技 资源 。 
科技 资源 的 树 结构 分 类 体系 的 建立 应 遵循 科学 
性 、 系 统 性 、 可 延性 和 兼容 性 的 原则 ， 要 尽 可 
能 请 领域 专家 参与 。 

科技 资源 的 内 容 和 概念 随时 间 不 断 变化 ， 
科技 资源 分 类 模型 需要 与 时 俱 进 , 不 断 维护 ， 
或 者 在 编码 搜索 系统 中 建立 对 应 表 ， 实 现在 
不 同时 期 的 科技 资源 分 类 模型 的 统一 搜索 ， 
这 样 可 以 解决 传统 的 科技 资源 分 类 模型 修改 
难 、 灵 活性 差 等 问题 。 例 如 ， 通 过 构建 基于 
互联 网 的 科技 资源 分 类 模型 建立 、 维 护 和 应 
用 平台 ,来 提高 传统 科技 资源 分 类 模型 的 灵 
活性 和 易 维护 性 。 

(2 ) 关键 词 结 构 的 科技 资源 分 类 模型 的 建 
立方 法 。 主 要 采用 大 众 分 类 法 ， 即 关键 词 或 标 
签 是 由 大 众 自 己 选择 。 中 关键 词 的 定义 : 出 现 
在 文献 的 标题 、 摘 要 以 及 正文 中 ， 能 够 表达 文 
献 主题 内 容 、 可 作为 检索 入 口 的 未 经 过 规范 化 
的 自然 语言 词汇 2。@) 标 签 的 定义 : 不 依赖 于 
固定 分 类 , 通过 用 户 针 对 内 容 添 加 的 简短 描述 ， 
以 方便 搜索 OO, 

关键 词 结构 的 科技 资源 分 类 模型 最 大 的 问 
题 是 随意 性 较 大 、 规 范 性 较 弱 ， 这 显著 增加 了 
搜索 或 匹配 科技 资源 的 难度 。 但 在 互联 网 环境 
中 ， 随 着 关键 词 或 标签 用 户 数 的 增加 ， 这 种 随 
意 性 将 会 显著 减少 ， 因 为 如 果 科 技 资源 发 布 者 
所 采用 的 关键 词 或 标签 太 随 意 、 不 规范 ， 就 会 
使 其 发 布 的 科技 资源 难以 被 人 搜索 和 利用 ， 达 
不 到 其 发 布 科 技 资源 的 目的 ; 同样 ， 如 果 科 技 
资源 搜索 者 所 采用 的 关键 词 或 标签 不 规范 ， 就 
会 使 其 难以 搜索 到 想 要 的 科技 资源 。 最 终 对 于 
同一 科技 资源 ， 大 家 就 会 趋向 于 采用 同样 的 关 
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键 词 或 标签 。 这 是 一 种 自 组 织 优 化 的 模式 ， 互 
联网 平台 要 为 促进 关键 词 或 标签 的 自 组 织 优化 
提供 良好 的 环境 。 例 如 ， 当 用 户 输入 关键 词 或 
标签 时 ， 平 台 提示 该 关键 词 或 标签 是 否 是 常用 
的 ， 并 根据 科技 资源 的 特点 智能 推荐 常用 的 关 
键 词 或 标签 。 

关键 词 或 标签 可 以 采用 本 体 模 型 进行 优化 ， 
提高 基于 关键 词 或 标签 的 科技 资源 的 搜 准 率 和 
REK, 具体 见 第 5 节 。 
全 科技 资源 元 数据 模型 及 建立 方法 
4.1 科技 资源 元 数据 模型 的 定义 

科技 资源 元 数据 规范 了 科技 资源 描述 空间 
的 维度 ， 是 描述 数据 的 数据 (data about data ) , 
用 于 描述 科技 资源 ( 包括 实物 资源 和 信息 资源 ) 
的 内 容 、 覆 盖 范 围 、 质 量 、 管 理 方式 、 数 据 的 
所 有 者 以 及 提供 方式 等 有 关 信 息 的 数据 PK 
于 元 数据 有 不 同 的 定义 : 

(1) 关于 数据 的 数据 中 1。 

(2) 定义 和 描述 其 他 数据 的 数据 所。 

(3) 关于 数据 或 数据 元 素 的 数据 ( 可 能 
括 其 数据 描述 ) ， 以 及 关于 数据 拥有 权 、 存 取 
路 径 、 访 问 权 和 数据 易 变性 的 数据 中 1。 

(4) 描述 数据 及 其 环境 的 数据 中 。 

(5 ) 描述 物 联网 数据 及 其 相关 信息 的 数 
fa), 

(6) 关于 数据 的 数据 ， 主 要 是 描述 数据 属 
性 (property ) 的 信息 1。 

(7) 描述 科技 报告 的 一 种 结构 化 数据 ， 用 
于 实现 检索 、 管 理 、 使 用 、 保 存 等 功能 "1。 

这 种 元 数据 定义 的 多 义 性 说 明了 建立 统一 
的 科技 资源 元 数据 的 难度 。 

科技 资源 的 元 数据 包括 : 科技 资源 名 称 、 
类 型 ,发布 者 .发布 时 间 存放 地 点 .关键 词 等 扬 。 
对 不 同 的 科技 资源 ( 如 知识 、 数 据 、 人 才 、 产 品 、 
软件 、 硬 件 等 ) 有 相应 的 元 数据 模型 ， 有些 已 
经 有 标准 ， 需 要 考虑 尽 可 能 采用 。 
4.2 科技 资源 元 数据 模型 的 需求 
不 同 的 人 对 科技 资源 描述 空间 的 维度 往往 
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有 不 同 的 定义 ， 这 就 导致 了 科技 资源 集成 难 和 
搜索 难 。 科 技 资源 元 数据 通过 对 科技 资源 对 象 
进行 统一 规范 描述 , 有 助 于 对 科技 资源 的 组 织 、 
集成 、 检 索 、 发 现 和 管理 
4.3 科技 资源 元 数据 模型 的 建立 方法 

(1) 参考 已 有 的 科技 资源 元 数据 模型 ， 调 
查 搜 集 尽 可 能 多 的 科技 资源 元 数据 ， 建 立 科 技 
资源 元 数据 参考 模型 库 。2020 年 1 月 29 日 在 国 
家 标准 信息 查询 平台 Chttp://www.gov.cn/fuwu/ 
bzxxcx/bzh.htm ) 输入 “元 数据 ”搜索 到 国家 标 
YE 66 个 、 行 业 标 准 53 个、 地 方 标准 24 个 。 
例如 ， 目 前 已 经 有 《GBMT 36478.3-2019 物 联网 
信息 交换 和 共享 第 3 部 分 : 元 数据 》《GB/T 
38154-2019 重要 产品 追溯 核心 元 数据 》《GB/T 
37282-2019 产品 标签 内 容 核心 元 数据 》《GB/T 
37600-2018 全 国 主要 产品 分 类 产品 类 别 核心 元 
数据 》《GB/T 35430-2017 信息 与 文献 期 刊 描述 
型 元 数据 元 素 集 》《GB/T 35397-2017 科技 人 才 
元 数据 元 素 集 》《GB/T 30535-2014 科技 报告 元 
数据 规范 》《GB/T 30523-2014 科技 平台 资源 核 
心 元 数据 》《GB/T 30522-2014 科技 平台 元 数据 
标准 化 基本 原则 与 方法 》《GB/T 30522-2014 科 
技 平台 元 数据 标准 化 基本 原则 与 方法 》《GB/T 
26499.3-2011 机 械 科学 数据 第 3 部 分 : 元 数据 》 
《GB/T 25100-2010 信息 与 文献 都 柏林 核心 元 数 
据 元 素 集 》《GB/T 24662-2009 电子 商务 产品 核 
心 元 数据 》《GB/T 18391-2009 信息 技术 元 数据 
注册 系统 (MDR)》《GB/T 22373-2008 标准 文献 
JOŽE X GB/T 22373-2008 标准 文献 元 数据 等。 

(2) 从 科技 资源 元 数据 参考 模型 库 中 ， 根 
据 需 要 选择 合适 的 科技 资源 元 数据 。 如 果 元 数 
据 数 量 太 多 ， 使 用 不 便 ; 元 数据 数量 太 少 ， 则 
描述 不 完整 。 需 要 进行 元 数据 的 相关 性 分 析 ， 
去 掉 相 关 性 较 大 的 两 个 元 数据 中 的 一 个 ; 需要 
进行 元 数据 的 重要 性 评价 ， 把 对 科技 资源 描述 
价值 相对 较 小 的 元 数据 去 掉 ; 元 数据 的 数量 最 
终 要 考虑 科技 资源 描述 的 完整 性 、 特 征 可 识别 
性 、 可 分 类 性 等 ; 元 数据 的 数量 还 与 科技 资源 
的 其 他 具体 描述 需求 有 关 ; 元 数据 选择 与 元 数 
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据 建 立 和 管理 的 信息 化 水 平 有 关 ， 当 信息 化 较 
高 时 ， 元 数据 的 数量 可 以 多 些 。 

(3 ) 科技 资源 元 数据 类 型 可 以 由 专家 协商 
确定 ， 也 可 以 通过 大 数据 分 析 得 到 ， 或 者 由 专 
家 协商 和 大 数据 分 析 共 同 得 到 。 

(4 ) 协 同 建立 科技 资源 元 数据 模型 的 标准 。 
该 标准 涉及 面 广 、 用 户 多 ， 因 此 可 以 采用 维基 
(Wiki) 模式 ， 组 织 广 大 用 户 参 与 ， 协 同 提出 
和 修改 科技 资源 元 数据 模型 的 标准 。 

科技 资源 核心 元 数据 的 定义 是 : 描述 科 
技 资 源 最 基本 信息 的 元 数据 最 小 集合 〈 修改 自 
GB/T 30523-2014 科 技 平台 资源 核心 元 数据 ), 
包括 : 科技 资源 中 文 名 称 和 英文 名 称 、 科 技 资 
源 发 布 者 、 科 技 资源 发 布 时 间 ( 最近 提交 日 
期 ) 、 科 技 资源 存放 地 点 (信息 链接 地 址 ) 、 
科技 资源 知识 元 、 科 技 资源 关键 词 (或 标签 ) 、 
科技 资源 标识 编码 、 科 技 资源 标准 本 体 和 关联 
本 体 。 

元 数据 建立 方法 可 以 参考 《GB/T 30522- 
2014 科技 平台 元 数据 标准 化 基本 原则 与 方法 》 
(GB/T 26499.3-2011 机 械 科学 数据 第 3 部 分 : 
元 数据 》。 

全 科技 资源 本 体 模型 及 建立 方法 
5.1 科技 资源 本 体 模型 的 定义 

本 体 没有 统一 的 定义 ， 以 下 给 出 一 些 不 同 
领域 的 国家 标准 对 本 体 的 定义 : 

(1) 在 大 数据 语 境 下 ， 它 是 一 些 约束 后 续 
各 种 不 同 层次 逻辑 模型 的 语义 模型 "。 

(2) 计算 机 科学 领域 的 一 种 模型 ， 用 于 描 
述 用 一 套 对 象 类 型 ( 概念 或 者 说 类 ) 、 属 性 以 
及 关系 类 型 所 构成 的 世界 P", 

(3 ) 被 表述 为 一 系列 相互 关联 的 概念 与 定 
义 ， 这 种 表述 类 似 于 氢 词 表 中 的 术语 。 但 是 ， 
本 体 不 是 术语 标准 中 。 

(4) 使 用 计算 机 能 够 处 理 的 语言 对 论 域 的 
描述 1。 

(5 ) 在 文化 遗产 信息 资源 领域 ， 基 于 本 体 
的 模型 用 于 将 异 构 、 分 散 的 文化 遗产 信息 源 进 


202310.03036v1 


chinaXiv 


行 集成 、 交 换 ， 有 助 于 形成 通用 的 、 规 范 的 本 
体 模 型 ， 给 领域 专家 对 信息 的 编制 和 关联 检索 
EHHE PS, 

许多 领域 需要 通过 本 体 构建 ， 实 现 相 关 业 
务 的 标准 化 工作 ; 同时 ， 本 体 也 是 基于 Web 应 
用 的 互 操作 问题 的 关键 。 因 此 业界 正在 陆续 甫 
定 相关 的 本 体 标 准 。 

本 文 对 科技 资源 本 体 定 义 是 : 科技 资源 本 
体 模 型 规范 了 同一 科技 资源 的 名 称 术语 及 不 同 
名 称 术语 间 的 关系 。 

5.2 科技 资源 本 体 模型 的 需求 

不 同 的 人 对 科技 资源 往往 有 不 同 的 名 称 术 
语 及 名 称 术语 的 关系 ， 这 就 导致 了 科技 资源 集 
成 难 和 搜索 难 。 面 对 庞大 的 科技 资源 和 名 称 ， 
主要 存在 以 下 问题 : 

C1) 有 时 同一 科技 资源 有 多 种 名 称 术语 ， 
一 种 名 称 术语 描述 多 种 不 同 的 概念 ， 这 对 科技 
资源 的 集成 带 来 诸多 不 便 。 一 方面 需要 通过 标 
准 化 、 规 范 化 的 方法 解决 这 些 问题 ， 例 如 ， 采 
用 数据 字典 等 方式 ; 另 一 方面 可 以 通过 本 
体 方法 ， 建 立 标准 本 体 和 关联 本 体 。 标 准 本 体 
对 应 描述 某 一 概念 的 标准 术语 ， 关 联 本 体 对 应 
描述 这 一 概念 的 其 他 术语 。 在 信息 搜索 时 标准 
本 体 与 关联 本 体 一 起 用 于 搜索 。 科 技 资源 本 体 
模型 通过 对 科技 资源 对 象 进行 统一 规范 的 描述 ， 
有 助 于 对 科技 资源 的 组 织 、 集 成 、 检 索 、 发 现 
和 管理 。 


= 


在 不 引起 概念 混乱 的 情况 
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(2) 有 时 同一 科技 资源 有 多 种 概念 结构 ， 
这 对 科技 资源 的 集成 也 带 来 诸多 不 便 。 本 体 有 
助 于 解决 同一 概念 的 名 称 多 样 化 问题 和 概念 结 
构 混 乱 带 来 的 问题 。 名 称 多 样 化 问题 会 进一步 
导致 科技 资源 共享 和 利用 中 出 现 如 下 问题 : O 
搜索 到 的 科技 资源 信息 不 完整 @) 搜 索 到 的 科 
技 资源 信息 不 准确 ; 加 科技 资源 信息 集成 难 。 
概念 结构 混乱 会 带 来 科技 资源 分 类 混乱 、 资 源 
集成 难 和 搜索 难 的 问题 。 而 科技 资源 本 体 模 型 ， 
有 利于 实现 科技 资源 的 共享 、 集 成 、 服 务 , 例如 : 

@ 知识 资源 共享 : 满足 企业 知识 资源 库 统 
一 检索 、 企 业 知 识 图 谱 建 立 、 技 术 路 线 图 共 建 、 
技术 进化 图 共 建 、 知 识 推送 等 需求 ， 提 高 知识 
资源 的 有 序 化 程度 。 

@ 人 才 资 源 共 享 : 支持 对 人 才 资 源 的 统一 
描述 和 搜索 。 

@ 软件 资源 共享 : 支持 对 软件 资源 的 统一 
描述 和 搜索 ; 满足 不 同 阶段 和 不 同 单位 开发 的 
不 同 的 软件 系统 之 间 集 成 的 需要 ， 主 要 是 不 同 
数据 库 中 的 字段 名 的 映射 、 不 同 数据 结构 的 映 
射 等 的 需求 。 

@ 人 工 智能 系统 : 支持 知识 间 逻 辑 关系 的 
建立 、 推 理 机 的 实现 ， 满 足 人 工 专家 系统 、 智 
能 辅助 决策 系统 等 的 建立 等 。 

5.3 科技 资源 本 体 模型 的 建立 方法 

科技 资源 本 体 模型 包括 标准 本 体 和 关联 本 

体 ， 其 概念 如 图 4 所 示 : 


下 ， 标 准 本 体 简称 为 本 体 在 本 体 库 中 
进行 关联 

本 体 < 标准 本 体 〈B) [一 一 一 一 一 同 义 本体 (T) 
代 关 系 

例 : “计算 机 ” 例 : “电脑 ” 


科技 资源 本 体 模型 的 建立 方法 主要 包括 : 

(1) 了 解 企业 的 业务 组 织 及 工作 内 容 ， 确 
定 企业 所 需要 共享 的 科技 资源 范围 ; 确定 科技 
资源 本 体 的 需求 。 

(2) 初 选 科技 资源 本 体 ， 试 用 和 选择 科技 


图 4 本 体 、 标 准 本 体 和 同 义 本 体 的 关系 


资源 本 体 ， 包 括 标准 本 体 和 关联 本 体 。 
(3 ) 依靠 广大 科技 人 员 协 同 建立 科技 资源 
本 体 ， 并 通过 对 大 家 使 用 科技 资源 的 行为 的 跟 
踪 、 统 计 和 分 析 ， 不 断 优化 科技 资源 本 体 ”” 
标准 本 体 与 术语 概念 类 似 ， 可 以 参考 《GB/ 
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T 10112-2019 术语 工作 原则 与 方法 》《GB/ 
T 13725-2019 建立 术语 数据 库 的 一 般 原 则 与 方 
法 》。 

2020 年 1 月 29 日 在 国家 标准 信息 查询 平台 
( http://www.gov.cn/fuwu/bzxxcx/bzh.htm ) 输入 
“术语 ”搜索 到 相关 的 国家 标准 1 172 个 ,行业 
标准 840、 地 方 标准 932。 绝 大 多 数 是 各 种 产品 、 
技术 的 术语 标准 。 但 其 给 出 的 术语 数量 还 比较 
D>, 在 本 体 建 设 中 ， 需 要 适当 扩充 。 

p- 关联 本 体 则 是 术语 标准 中 所 缺乏 的 ， 其 
有 助 于 提高 科技 资源 的 搜 准 率 和 搜 全 率 ， 需 要 
花费 较 多 精力 从 术语 的 同义词 、 近 义 词 中 寻找 。 
O 科技 资源 知识 元 及 建立 方法 
6.1 科技 资源 知识 元 的 定义 

科技 资源 知识 元 "是 从 科技 资源 中 进一步 
提炼 而 成 的 科技 资源 中 的 最 核心 和 最 精炼 的 知 
WR, 往往 是 以 摘要 、 简 要 介绍 等 方式 展示 。 

已 有 标准 将 知识 元 定义 为 : 在 应 用 需求 下 ， 
表达 一 个 完整 事物 或 概念 的 不 必 再 分 的 独立 的 
知识 单元 I, 

科技 资源 知识 元 的 内 容 主 要 是 : 

(1) 目 的 /意义 : 简要 说 明科 技 资源 的 需求 、 
干什么 用 (AA, Why) 。 例 如 ， 某 科学 仪 
器 检测 的 目的 是 什么 。 

(2 ) 方法 /过 程 : 简要 说 明科 技 资源 的 建 
立 和 应 用 方法 (怎么 用 ，How ) 。 例 如 ， 某 科 
学 仪器 的 检测 原理 及 检测 精度 。 

(3) 结果 /结论 : 简要 说 明科 技 资源 的 内 
容 和 应 用 结果 ( 是 什么 ，What ) 。 例 如 ， 某 科 
学 仪器 的 具体 检测 内 容 ， 检 测 后 可 以 得 到 什么 
结果 。 

6.2 科技 资源 知识 元 的 需求 

知识 元 首先 是 从 文献 领域 发 展 起 来 的 。 早 
在 20 世纪 70 年 代 后 期 ， 美 国 专家 指出 : 文献 
数量 膨胀 之 后 ， 知 识 的 控制 单位 将 从 文献 深化 
到 文献 中 的 数据 、 公 式 、 事 实 、 结 论 等 最 小 的 
独立 的 “知识 元 ”， 知 识 元 可 以 被 称 为 是 文献 
管理 的 最 小 单位 。 知 识 元 不 仅 可 以 用 于 情报 管 
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理 中 的 文献 处 理 ， 而 且 ， 知 识 元 也 可 以 表示 其 

他 种 类 知识 载体 ， 如 专利 等 ， 将 其 中 所 涉及 的 

概念 、 论 据 、 论 证 以 及 创新 点 等 知识 核心 以 知 

识 元 的 方式 呈现 ， 以 此 作为 知识 管理 、 知 识 评 

价 以 及 知识 发 现 的 最 小 单元 1。 
科技 资源 知识 元 可 以 让 用 户 快速 地 了 解 有 

关 科 技 资源 的 主要 特点 和 内 容 ， 仅 仅 依靠 关键 

词 等 是 难以 了 解 科技 资源 的 大 致 面貌 。 科 技 资 

源 知 识 元 可 以 文 持 科技 资源 知识 图 谱 的 快速 构 

建 ， 支 持 科 技 资源 知识 元 之 间 的 快速 集成 。 

6.3 科技 资源 知识 元 的 建立 方法 
科技 资源 知识 元 的 内 容 主 要 是 : 
C1) 简要 说 明科 技 资源 的 需求 (为 什么 ， 

Why ) 。 例 如 ， 某 科学 仪器 检测 的 目的 是 什么 。 
(2) 简要 说 明科 技 资源 的 内 容 ( 是 什么 ， 

What) 。 例 如 ， 某 科学 仪器 的 具体 检测 内 容 。 
(3 ) 简要 说 明科 技 资源 的 应 用 方法 〈 怎么 

FA, How) 。 例 如 ， 某 科学 仪器 的 检测 原理 及 

检测 精度 。 

为 了 提高 科技 资源 的 搜索 和 利用 效率 ， 需 

要 按照 科技 资源 元 数据 模型 ， 采 用 标准 本 体 描 

述 科技 资源 。 

@@ 科 技 资源 图 谱 及 建立 方法 

71 科技 资源 图 谱 的 定义 
知识 图 谱 实 质 上 是 一 种 构建 实体 间 关 系 的 

语义 网 络 ， 它 可 以 形式 化 地 描述 客观 世界 中 的 

事物 及 其 相互 关系 。 如 今 ， 知 识 图 谱 被 用 来 指 

代 各 种 大 规模 的 知识 库 。2012 年 ， 谷 歌 率先 提 

出 了 知识 图 谱 的 概念 ， 旨 在 增强 搜索 引擎 的 理 

解 能 力 ， 提 高 搜索 质量 和 用 户 体验 忆 ， 此 后 ， 

知识 图 谱 的 研究 方向 受到 了 广泛 的 关注 。 知 识 

图 谱 以 其 强大 的 开放 性 、 互 联 性 和 语义 处 理 能 

力 为 互联 网 中 的 知识 互联 奠定 了 基础 。 

三 元 组 是 知识 图 谱 的 一 种 通用 的 表示 方式 ， 

Al; G=(E, R, S)。 其 中 ，E={fe e, …ebl) 表示 知 

识 库 中 的 实体 集合 ， 共 包含 E 种 不 同 的 实体 ; 

R= {1, r» *** Op} 表示 知识 库 中 的 关系 集合 ， 共 包 

含 民 | 种 不 同 的 关系 ; SEExRxE 代 表 知 识 库 
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中 的 三 元 组 集合 。 三 元 组 的 基本 形式 主要 包括 
实体 ( Entity )- 关 系 ( Relationship )- 实 体 ( Entity ) 
和 (实体 -属性 -属性 值 ) 等 。 每 个 实体 (概念 
的 外 延 ) 可 用 一 个 全 局 唯一 确定 的 ID 来 标识 ， 
每 个 属性 - 属性 值 对 可 用 来 刻画 实体 的 内 在 特 
性 ， 而 关系 可 用 来 连接 两 个 实体 ， 刻 画 它 们 之 
间 的 关联 。 

科技 资源 图 谱 的 概念 是 在 知识 图 谱 基 础 上 
发 展 起 来 的 ， 用 于 显示 科技 资源 发 展 进程 与 结 
构 关 系 的 一 系列 各 种 不 同 的 图 形 模型 ， 采 用 可 
视 化 技术 描述 知识 资源 及 其 载体 ， 挖掘、 分析、 
构建 绘制 和 显示 知识 及 它们 之 间 的 相互 联系 ， 
是 对 科技 资源 的 全 方位 关联 关系 的 描述 OO, 

上 海 人 工 智 能 公共 研发 资源 图 谱 已 经 收录 
人 工 智能 及 相关 领域 的 专家 人 才 信 息 超 过 10 万 
条 、 学 科 词 库 超 过 30 万 条 、 科 技 文献 超过 1 亿 


AAA > 


专利 图 庶 


图 5 科技 资源 图 


(1) 知识 图 谱 。 以 知识 分 类 体系 或 关键 词 
为 核心 , 建立 知识 之 间 的 各 种 关系 , 如 关联 关系 、 
层次 关系 、 衍 生 关系 、 相 似 关 系 等 ， 集 聚 知识 
的 属性 。 

(2) 数据 图 谱 。 说 明 数据 之 间 的 关系 ， 例 
如 , 面向 某 机 床 的 加 工 质量 的 原因 分 析 的 数据 ， 
包括 : 机 床 振动 数据 、 机 床 热 变形 数据 、 刀 具 
加 工 声 发 射 数据 、 刀 具 磨 损 视觉 监控 数据 、 工 
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篇 、 科 技 机 构 超 过 10 万 家 、 科 技 企 业 超过 1 万 
家 ， 为 全 球 科 研 从 业 人 员 带 来 全 新 的 知识 搜索 
服务 体验 以 及 基于 深度 数据 分 析 产 生 的 科研 趋 
势 可 视 化 分 析 ， 帮 助 科研 人 员 更 快 、 更 丰富 、 
更 精准 地 寻找 专业 科研 资源 并 发 现 科 研 热点 和 
未 来 方向 ， 有 效 增 加 科研 人 员 的 工作 效能 和 成 
果 吕 ;SciKG5 是 清华 大 学 计算 机 科学 领域 研 
发 的 知识 图 谱 ， 图 谱 由 概念 、 专 家 、 论 文 等 元 
素 构成 , 专家 和 论文 都 有 相应 规定 的 一 些 属性 ， 
将 专家 和 论文 关联 起 来 ， 用 于 帮助 研究 人 员 更 
好 地 搜索 计算 机 领域 的 专家 和 论文 等 ; gstore!™”! 
是 北京 大 学 建立 的 图 数据 库 ， 结 合 RDF 存储 和 
SPARQL 查询 ， 支 持 海量 的 三 元 组 知识 图 谱 数 
据 管理 ， 并 被 应 用 于 全 球 微生物 中 心 知 识 图 谱 
构建 和 方正 智 汇 对 出 版 资源 的 统一 管理 中 。 科 
技 资源 图 谱 的 内 容 和 需求 如 图 5 所 示 : 


帮助 快速 找到 所 需要 的 科技 
资源 ， 提 高 资源 的 利用 效率 


材料 图 庶 
配件 图 庶 


谱 的 内 容 和 需求 


件 加 工 表面 质量 数据 等 ， 由 数据 图 谱 集成 ， 目 
的 是 便于 数据 的 管理 和 利用 。 数 据 图 谱 还 关联 
获取 这 些 数据 的 人 、 传 感 顺 、 软 件 等 ， 关 联 相 
应 的 机 床 、 刀 具 、 工 件 等 参数 。 其 目的 是 使 这 
些 数据 能 够 被 大 家 共享 重用 , 提高 数据 的 价值 。 

(3 ) 人 才 图 谱 。 以 知识 分 类 体系 或 关键 词 
为 核心 , 建立 人 才 之 间 的 各 种 关系 , 如 师 生 关系 、 
合作 伙伴 关系 、 竞 争 对 手 关 系 、 专 业 相 似 关系 、 
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专业 互补 关系 等 ， 并 集聚 人 才 的 各 种 成 果 。 

(4) 产品 图 谱 。 以 产品 分 类 体系 或 关键 词 
为 核心 , 建立 产品 之 间 的 各 种 关系 , 如 层次 关系 、 
相似 关系 、 成 套 关 系 、 变 型 关系 、 配 置 关系 等 ， 
并 集聚 产品 的 各 种 信息 。 

(5 ) 软件 图 谱 。 建立 软件 之 间 的 各 种 关系 ， 
如 可 组 合 关 系 、 可 变型 关系 、 可 置换 关系 等 ， 
并 集聚 软件 的 各 种 相关 描述 信息 。 

(6 ) 人 硬件 图 谱 。 建立 硬件 之 间 的 各 种 关系 ， 
如 层次 关系 、 相 似 关系 、 成 套 关 系 等 ， 并 集聚 
硬件 的 各 种 相关 描述 信息 。 人 硬件 种 类 很 多 ， 差 
别 很 大 ， 所 以 首先 需要 对 硬件 进行 分 类 。 
7.2 科技 资源 图 谱 的 需求 

科技 资源 之 间 具 有 一 定 的 关联 性 ， 可 以 采 
用 科技 资源 图 谱 对 其 进行 描述 。 利 用 科技 资源 
图 谱 可 以 帮助 快速 搜索 到 系统 化 的 科技 资源 ， 
提高 科技 资源 的 利用 效率 。 例 如 ， 数 据 之 间 的 
关系 通过 数据 图 谱 可 以 完整 获得 。 

通过 科技 资源 图 谱 可 以 有 序 化 集成 和 全 方 
位 描述 科技 资源 ,方便 大 家 共享 。 
7.3 科技 资源 图 谱 的 建立 方法 


作 量 很 大 ， 并 会 因 人 而 异 ， 需 要 采用 透明 公平 
的 方法 激励 大 家 参与 科技 资源 描述 ， 需 要 采用 
大 数据 和 群体 智能 的 方法 提高 科技 资源 描述 的 
自动 化 水 平和 准确 性 。 

不 同 的 专家 由 于 自己 所 擅长 的 细 分 领域 的 
不 同 、 科 研 水 平和 素养 的 不 同 ， 所 以 在 科技 资 
源 图 谱 建 立 中 需要 给 予 不 同 的 权重 。 

知识 图 谱 的 构建 模式 分 为 自 顶 向 下 (top- 
botton ) MAJEE (botton-top ) PPR A TE 
下 指 首先 定义 本 体 库 和 数据 模式 ， 再 向 知识 库 
中 添加 一 系列 事实 ， 即 先 模式 层 后 数据 层 。 自 
底 向 上 指 先 提取 文本 分 析 数 据 , 再 由 数据 驱动 ， 
设计 知识 库 的 模式 层 ， 即 先 数据 层 后 模式 层 。 
一 般 的 知识 图 谱 是 自 底 向 上 构建 的 ， 比 如 谷歌 
的 Knowledge Vault 知识 库 。 然 而 ， 对 于 垂直 领 
域 知识 图 谱 ， 在 处 理 复杂 和 不 稳定 的 业务 需求 
时 ， 需 要 特定 于 行业 的 专业 知识 和 高 质量 的 数 
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据 ， 则 更 倾向 于 采用 上 自 顶 向 下 的 方法 。 


全 结语 


创新 是 我 国 的 发 展 战略 ， 创 新 尤其 是 协同 
创新 需要 科技 资源 共享 ， 而 科技 资源 共享 的 前 
提 是 要 有 一 套 行 之 有 效 的 规范 、 合 理 、 科 学 的 
科技 资源 描述 模型 和 建立 方法 。 

笔者 提出 一 套 科技 资源 描述 模型 的 结构 框 
架 ， 其 特点 是 对 科技 资源 从 不 同 角 度 进行 规范 
化 ， 形 成 一 个 整体 、 系 统 的 描述 ， 有 效 支 持 科 
技 资源 的 集成 、 评 价 和 共享 ， 包 括 : 

C1) 科技 资源 分 类 模型 。 主 要 是 树 结构 和 
关键 词 两 种 分 类 模型 ， 它 们 各 有 优 缺 点 ， 可 以 
互补 。 建 议 以 树 结构 分 类 模型 为 主 ， 关 键 词 分 
类 模型 为 辅 ， 以 便 适 合 大 范围 、 路 专业 的 科技 
资源 分 类 。 

(2) 科技 资源 元 数据 模型 。 从 不 同 种 类 的 
科技 资源 集聚 和 共享 的 需求 出 发 ， 提 出 统一 的 
科技 资源 元 数据 模型 。 

(3 ) 科技 资源 本 体 模 型 。 面 对 庞大 的 科技 
资源 概念 和 和 名称， 存在 的 问题 是 : 有 时 同一 概 
念 有 多 种 名 称 ， 这 对 科技 资源 的 集成 带 来 诸多 
不 便 。 一 方面 需要 通过 标准 化 、 规 范 化 的 方法 
解决 这 些 问 题 ， 例 如 ， 采 用 术语 标准 、 数 据 字 
典 等 方式 ; 另 一 方面 可 以 通过 本 体 方法 ， 建 立 
标准 本 体 和 关联 本 体 。 标 准 本 体 对 应 描述 某 一 
概念 的 标准 术语 ， 关 联 本 体 对 应 描述 这 一 概念 
的 其 他 术语 。 在 信息 搜索 时 标准 本 体 与 关联 本 
体 一 起 用 于 搜索 。 

(4) 科技 资源 知识 元 。 将 科技 资源 的 主要 
内 容 简 要 描述 出 来 ,方便 使 用 ,支持 科技 资源 
图 谱 的 建立 。 

(5 ) 科技 资源 图 谱 。 将 知识 、 数 据 、 产 品 、 
人 才 、 软 件 、 硬 件 等 科技 资源 采用 图 谱 的 方式 
进行 关联 和 可 视 化 ,使 科技 资源 之 间 的 关系 清 
晰 化 ， 使 围绕 某 一 任务 的 科技 资源 集聚 为 一 个 
整体 ， 方 便 科 技 资源 的 搜索 和 利用 。 

上 述 模型 对 科技 资源 描述 提供 了 一 个 比较 
规范 、 简 要 和 完整 的 整体 解决 方案 ， 有 助 于 提 
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高 科技 资源 的 集成 、 评 价 和 分 享 能 力 。 

笔者 还 提出 一 套 科 技 资源 描述 模型 的 建立 
方法 ， 其 特点 是 利用 新 一 代 信息 技术 ， 依 靠 大 
众 共 建 模型 ， 依 靠 科 技 资源 描述 过 程 的 大 数据 
智能 建立 和 优化 模型 。 科 技 资源 描述 模型 大 多 
是 科技 资源 共享 中 的 基础 标准 , 这 些 标准 很 多 ， 
并 且 经 常 变 化 ,需要 通过 开放 分布. 并行 、 协 同 、 
智能 的 方法 共 建 。 

开放 的 方法 是 指 这 些 标准 建设 开放 给 感 兴 
趣 的 企业 ， 大 家 一 起 参与 。 分 布 的 方法 是 指 这 
些 标准 建设 者 是 平等 的 ， 谁 贡献 大 ， 谁 就 是 标 
准 起 草 者 ; 标准 起 草 者 按照 贡献 大 小 排名 。 并 
行 的 方法 是 指 这 些 标准 的 建设 与 相关 系统 的 建 
立 和 开发 并 行 的 ， 不 是 等 到 方法 和 技术 已 经 很 
成 熟 了 ， 再 建 标 准 。 协 同 的 方法 是 指 这 些 标准 
建设 者 相互 协同 ,资源 共享 ， 提 高 标准 的 水 平 ， 
缩短 标准 建设 周期 。 智 能 的 方法 是 指 这 些 标 准 
建设 过 程 利用 大 数据 分 析 方 法 ， 简 化 标准 建设 
的 工作 量 ; 智能 地 监控 标准 建设 工作 ， 每 个 人 
的 贡献 透明 ， 排 名 公平 。 
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Description Method of Scientific and Technological Resources 


Gu Fu Liu Yangshengyan Gu Xinjian 
School of Mechanical Engineering, Institute of Industrial Engineering, Zhejiang University, Hangzhou 
310027 

Abstract: [Purpose/significance] Scientific and technological innovation is the key point of 
development, and scientific and technological resources sharing and collaborative innovation are 
indispensable. Sharing of scientific and technological resources is a systematic project, and first of all, in 
order to integrate, evaluate and share scientific and technological resources, we need to establish a description 
model of scientific and technological resources. [Method/process] The description model of science and 
technology resources defined in this paper includes classification model of scientific and technological 
resources, meta data model of science and technology resources, ontology model of science and technology 
resources, knowledge meta model of science and technology resources, science and technology resource 
graph model, etc. Scientific and technological resources include knowledge, data, products, talents, software, 
hardware and other resources. We proposed the method of establishing the model of science and technology 
resources description, as well as the characteristic and function of it. [Result/conclusion] The main 
contributions of this paper are as follows: standardizing the description model of science and technology 
resources is helpful for the integration and sharing of different types of science and technology resources; 
by the integration research of different types of description models of science and technology resources, we 
form the system architecture of the description model of science and technology resources, which provides an 
overall solution for the comprehensive and systematic description of science and technology resources, and 
helps us to share the science and technology resources; we put forward a method to build a description model 
of science and technology resources, based on crowd-sourcing theory and big data AI of description process 
of scientific and technological resources, and we establish and optimize the description model of science and 
technology resources. 
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